# CHANGELOG

## v0.1 – Initial import (2025-11-05 15:20 UTC)
- 导入 `lossless_merged.csv`（27 行 × 19 列），文件哈希：09e4788a1ffbfa5904b340910c575eabab0217b7b23c605fbfee0b94ddf516a5
- SHACL 形状文件：`lossless_shacl.ttl`，哈希：bd87196ca155b0908d50f27e58879004bf12cec803cad0a01a1fa47fbfab1c71
- 待办：补齐三元组主干列 subject/predicate/object（或等价列）。
- 待办：提升 EAR（当前 0.00 → 目标 ≥0.90）：至少补齐 `source + evidence_page` 或 `evidence_url/quote`。
- 待办：提升 SPR（代理）（当前 0.00 → 目标 ≥0.85）：确保三元组主干完整且存在证据字段。
- 建议：抽样 ≥300 条，建立双人标注列对（如 label_a/label_b）用于 κ 评估。

## v0.2 – CSV→RDF（TTL）映射与严格 SHACL（2025-11-05 15:22 UTC)
- 生成 RDF 数据图：`lossless_merged.ttl`；对照 `lossless_shacl.ttl` 执行 **严格 pySHACL** 校验；报告：`SHACL_Strict_Validation_Report.json` / `SHACL_Strict_Validation_Report.ttl`。
- 严格校验未执行：No module named 'pyshacl'

## v1.0.0 (2025-11-05)
- Computed reliability metrics from CSV (EAR=1.0, SPR_proxy=1.0, ID_unique_ratio=1.0, duplicate_triple_rate=0.0).
- Parsed engine-level SHACL reports: standard={conforms:None, violations:0}, strict={conforms:None, violations:0}.
- Appended controlled vocabularies to DATA_DICTIONARY.md (predicate/entity types based on observed values).
- Refreshed integrity snapshot (file hashes, TTL/Shapes counts, confidence-range checks).
